iT邦幫忙

2019 iT 邦幫忙鐵人賽

DAY 1
1

本系列與另外一個系列 『UP, Scrum 與 AI專案』 互相呼應。後者希望用虛構的專案,從立案到完成虛構專案『AI探索』的第一個Sprint。以故事中各角色的對話來點出UP, Scrum的重點或者精神所在。為了不讓故事過於冗長,原先要在故事裡談到的技術細節就搬到這裡。

因為鐵人賽規則要在十月十六結束前發出第一篇文章,先發出這篇文章。這樣變成與『UP, Scrum 與 AI專案』 這系列有時間差,會有點搭不上。也許過一週後,這篇文章講的內容才會出現在上述系列對應文章。


Cash 邀請專案成員對軟硬體環境感興趣的參與此討論會,結果全部的人都參加了。佳麗覺得了解環境需求,應可幫助她聽懂『利害關係人的期待或要求』;而Gavin說自己是 Product Owner 是需要知道要建制環境花多少預算。

在簡略說明Cash在此Sprint 負責『搭建Deep Learning 環境』的工作,他先拋磚引玉提出建議方案,理由是借用閒置設備,再花一點預算, 最快時間就可以搭建給大家共用的機器學習訓練環境:

-硬體借用現在幾乎閒置的VR測試機器,因為有 Nvidia 1080 Ti 的顯示卡,
-但 RAM 必須將 16GB 擴充至少為 64GB,
-硬碟加一塊 1TB SSD。CPU 原為 i7-6700 就維持不變。
-OS: 將 Windows 改為 Ubuntu Server,大家以 ssh 連線上來使用。
-另外安裝 Docker。
-主要開發用語言定為 Python

光是硬體就有不同意見: Molly 知道 Nvidia DGX 比較專業,訓練模型的速度會快幾十倍;Pete 認為Google/亞馬遜/Microsoft 等雲計算服務提供商都有虛擬機可以按使用時數計算;而Moore擔心計算能力不足,如果同時兩人或以上在訓練模型,可能無法負擔。

Cash解釋他的提議:”我的提議是借用我原部門閒置的VR設備,現在是我在保管,做簡易升級,大約只要花費新台幣兩三萬元,就可以訓練大多數的深度神經網路模型。至於DGX印象第一代報價要三百萬上下;而二代要千萬以上。”

佳麗以專案的階段來看,這一個 Sprint 應該是還停留在了解AI相關的理論或是市場研究,理論上還不知道要做什麼,提醒大家謹慎開規格,畢竟最高達千萬的設備可不能真讓它變成閒置資產。

Gavin聽到預算可以有這麼高的落差,表明:”我先講個人的偏好,硬體如同軟體也該增量採購,不用一次買未來幾年才發生的需求。如果沒造成重複購置的浪費;或者硬體跌價速度可以覆蓋重複購置的浪費,那儘量由小買起。另外提醒大家超過一個金額的軟硬體採購就必須簽到董事長,經驗來看,核准下來遙遙無期。那Pete 請問如果雲計算如何計費?”

Pete 給大家一個粗估數字每小時約1-40美金,看使用的雲計算CPU, RAM, GPU 容量或其他規格而定,有人練習一個自動翻譯的模型跑了三天,花了台幣兩千多元。雖然有價格約四分之一的所謂 『先佔虛擬機器 』帶GPU的方案可用,但我們還不熟悉深度學習的容錯性,建議熟悉後再考慮使用,以免訓練幾天的成果毀於一旦。

Fields 因為兩萬多元的採購案 Gavin 權限內就可以直接批,建議趕快採買RAM, SSD,先建立環境,等大家熟悉了,有實際的大量計算需求時再評估買雲端計算,或是採購高端一點的 GPU Server,大家居然立即有共識。

Molly 以她過去做 NLP 來背書,至少從文獻來看,拿這樣規格做NLP機器學習的訓練工作是夠用,至於速度當然有錢越快越好,但是這樣的規格大家練習是可以被接受的。

Cash 也提醒大家,如果只是做練習,又剛好有PC或Notebook帶 Nvidia GPU 的顯示卡,可以考慮安裝 Ubuntu Desktop就可以做點事了,可以幫忙安裝成 Windows 10 與 Ubuntu Desktop 雙OS開機做選擇。


下一篇
環境-OS
系列文
深度學習所需入門知識--一位初學者的認知31
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言